دسته بندی داده های دورده ای با ابرمستطیل موازی محورهای مختصات
Authors
abstract
یکی از زمینه های فعالیت در یادگیری ماشین و شناسایی الگو یادگیری با ناظر می باشد. در یادگیری با ناظر برچسب داده های آموزشی موجود است. در مسایل دورده ای، هدف محاسبه فرضیه ای است که بتواند به بهترین شکل ممکن و با کمترین مقدار خطا داده های با دو ردهی مثبت و منفی را از یکدیگر جدا کند. انواع روش های یادگیری با ناظر پیشنهاد شده است. به عنوان مثال می توان به درخت های تصمیم، یادگیر svm و روش های نزدیکترین همسایه اشاره کرد. در این مقاله بر عملکرد درخت های تصمیم متمرکز می شویم. عملکرد درخت تصمیم مشابه پیدا کردن ابرصفحه های تقسیم کننده در فضای d بعدی است، بطوریکه داده های موجود را به درستی رده بندی کند و تا حد ممکن رده بندی صحیح داده های آینده را نیز بدست آورد. دیدگاه هندسی عملکرد درخت تصمیم ما را به مفهوم تفکیک پذیری در هندسه محاسباتی نزدیک می کند. از بین کلیه الگوریتم های تفکیک پذیری موجود، مساله محاسبه مستطیل با حداکثر اختلاف دو رنگ را مطرح می کنیم. این مساله ارتباط نزدیکی با مساله درخت تصمیم در یادگیری ماشین دارد. در ادامه الگوریتم محاسبه مستطیل با حداکثر اختلاف دو رنگ را در یک، دو، سه و d بعد پیاده سازی می کنیم. نتیجه پیاده سازی نشان دهنده آن است که این الگوریتم، الگوریتمی قابل رقابت با الگوریتم شناخته شده c4.5 است.
similar resources
دستهبندی دادههای دوردهای با ابرمستطیل موازی محورهای مختصات
One of the machine learning tasks is supervised learning. In supervised learning we infer a function from labeled training data. The goal of supervised learning algorithms is learning a good hypothesis that minimizes the sum of the errors. A wide range of supervised algorithms is available such as decision tress, SVM, and KNN methods. In this paper we focus on decision tree algorithms. When we ...
full textارائه یک الگوریتم خوشه بندی برای داده های دسته ای با ترکیب معیارها
Clustering is one of the main techniques in data mining. Clustering is a process that classifies data set into groups. In clustering, the data in a cluster are the closest to each other and the data in two different clusters have the most difference. Clustering algorithms are divided into two categories according to the type of data: Clustering algorithms for numerical data and clustering algor...
full textرویکرد شبیهسازی در حل مسأله زمانبندی ماشین های موازی پردازشگر دسته ای با زمان های احتمالی
در این مقاله، مسأله زمانبندی ماشینهای موازی پردازشگر دستهای با هدف حداقل کردن حداکثر زمان تکمیل کارها بررسی میشود. نوآوری این پژوهش، به کارگیری زمان های پردازش و در دسترس بودن کارها به صورت احتمالی است. در تحقیقات پیشین اثبات شده است که مسأله مورد بررسی دارای پیچیدگی سخت است. بنابراین، از روشهای ابتکاری برای حل مسأله استفاده میشود. مسأله مورد مطالعه، دو مرحله تصمیمگیری دارد. در مرحله ا...
full textارائه یک الگوریتم خوشه بندی برای داده های دسته ای با ترکیب معیارها
خوشه بندی یکی از تکنیک های اصلی داده کاوی است. خوشه بندی فرایندی است که مجموعه داده ها را داخل گروه هایی طبقه بندی می کند. در خوشه بندی داده های موجود در یک خوشه بیشترین شباهت را به هم دارند و داده های موجود در دو خوشه متفاوت بیشترین تفاوت را با هم دارند. الگوریتم های خوشه بندی با توجه به نوع داده ها به دو دسته تقسیم می شوند: الگوریتم های خوشه بندی داده های عددی و الگوریتم های خوشه بندی داده ها...
full textروشی کارا برای پیادهسازی موازی الگوریتم دسته بندی بسته درخت سلسلهمراتبی بر روی واحد پردازش گرافیکی
چکیده: دستهبندی بستهها، پردازشی اساسی در پردازندههای شبکهای است. در این فرآیند، بستههای ورودی از طریق تطبیق با مجموعهای از فیلترها به جریانهای مشخص طبقهبندی میشوند. پیادهسازیهای نرمافزاری الگوریتمهای دستهبندی با وجود هزینه کمتر و توسعهپذیری بیشتر نسبت به پیادهسازیهای سختافزاری، سرعت پایینتری دارند. در این مقاله، از قابلیت پردازش موازی پردازندههای گرافیکی برای تسریع الگوری...
full textدسته بندی داده های جریانی فازی با استفاده از تحلیل پوششی داده ها
در این تحقیق یک روش دسته بندی داده های غیرقطعی از نوع فازی که از جمله چالش برانگیزترین حوزه های تحلیل داده محسوب می شود، ارائه شده است. در واقع حجم بالا و پیچیدگی روش های تحلیل داده مانع از توسعه روش هایی جهت تحلیل داده های فازی می شود. با این حال در برخی حوزه های دیگر همچون برنامه ریزی ریاضی پیشرفت های چشمگیری در مدل سازی سیستم هایی که داده های فازی از آنها در اختیار است، بدست آمده است و لذا ت...
full textMy Resources
Save resource for easier access later
Journal title:
فناوری اطلاعات و ارتباطات ایرانجلد ۷، شماره ۲۵، صفحات ۱-۱۴
Hosted on Doprax cloud platform doprax.com
copyright © 2015-2023